GI - Workshop Grundlagen von Datenbanken 31 . 05 . 2011 - 03 . 06 . 2011 Obergurgl , Tirol , Österreich
نویسندگان
چکیده
This talk presents work on transforming SQL-IMDB, a commercial available inmemory database system, into a massive parallel, array structured data processor extending the “classic” query engine architecture with GPU based co-processing facilities. The chosen approach is not just a simple re-implementation of common database functionality like sorting, stream processing and joins on GPUs, instead we take a holistic view and extend the entire query engine to work as a genuine, inmemory, GPU supported database engine. We have partitioned the query engine so that both CPU and GPU are doing what they are best at. The new SQL-IMDBg query execution engine is a “Split-Work” engine which takes care to optimize, schedule and execute the query plan simultaneous and in the most efficient way on two (or more) different memory devices. The principal architecture of the engine, based on simultaneous managing multiple memory devices (local/shared/flashmemory ), was a natural fit to include the new GPU/video memory as just another (high speed) memory device. All internal core engine data structures are now based on simple array structures, for maximum parallel access support on multiand many core hardware. Data tables located on GPU video memory can always queried together with CPU localand shared-memory tables in “mixed” query statements. Columns on GPU tables are also accessible through GPU based indexes. A special index structure was developed based on sorted containers supporting both CPU and GPU based index lookups. Table data can be manually and automatically split between CPU and GPU and is held in vertically partitioned columns, which ease the stream like processing for basic scan primitives and coalesced memory access mechanism on GPU devices. Based on our experience gained, we see the GPU/video memory as another important high speed memory device for in-memory database systems, but which do not yet fit well into the architecture of current database engines and therefore require a major effort in re-engineering the entire core database architecture.
منابع مشابه
Conceptual Views for Entity-Centric Search
The retrieval of entity data has always been a core application of database systems and querying an entity's attributes can be efficiently done using declarative languages like SQL. But today's retrieval tasks more and more focus also on conceptual aspects of entities, which often are not directly expressed by attributes. For instance, users might want to find a 'thrilling' novel, unfortunately...
متن کاملProceedings of the 27 th GI - Workshop Grundlagen
Datenflusssprachen haben in den vergangenen Jahren speziell im Kontext von Big-Data-Plattformen etwa in Form von Pig oder Jaql große Aufmerksamkeit gewonnen. Sie bieten sich jedoch auch für die Verarbeitung und Analyse dynamischer Daten bzw. Datenströme an. Ähnlich wie bei klassischen Anfragesprachen besteht bei Datenflusssprachen die Aufgabe, aus (mehr oder weniger) deklarativen Spezifikatione...
متن کاملDaten in den Lebenswissenschaften: Datenbanken als Kommunikationszentrum
Innerhalb der Informatik in den Lebenswissenschaften gibt es Communities, die aus verschiedenen Motivationen an ähnlichen Fragestellungen arbeiten. Auf der einen Seite stehen die Informatiker, die sich von der Informatik ausgehend mit den spezifischen Problemen von Anwendungen in der Biologie und Medizin befassen. Auf der anderen Seite stehen Biologen und Mediziner, die aus ihrem Fachgebiet her...
متن کاملDie probabilistische Ähnlichkeitsanfragesprache QSQL2
Die quantenlogik-basierte probabilistische Ähnlichkeitsanfragesprache QSQL2 soll vorgestellt werden. Dabei liegt das Hauptaugenmerk auf der Formulierung von Anfragen, welche “unsicher” sind, also nicht nur die traditionelle Boolesche Werte wahr und falsch annehmen können. QSQL2 kann Ungenauigkeiten sowohl auf Relationenebene als Eintrittswahrscheinlichkeiten, als auch auf Prädikatebene als Rele...
متن کاملKriterien für Datenpersistenz bei Enterprise Data Warehouse Systemen auf In-Memory Datenbanken
Persistente Datenhaltung über mehrere Schichten innerhalb eines Enterprise Data Warehouse Systems ist notwendig, um den dort vorhandenen, sehr großen Datenbestand nutzen zu können, z.B. für Reporting und Analyse. Die Pflege und Wartung solcher meist redundanten Daten ist jedoch sehr komplex und erfordert einen hohen Aufwand an Zeit und Ressourcen. Neueste In-MemoryTechnologien ermöglichen gute ...
متن کامل